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摘 要 : 针对 当前 肿瘤 类 疾病 诊治 过 程 中 存在 的 错误 与 过 度 医 疗 问题 ， 基 于 医疗 大 数据 提取 出 相似 病案 专家 处 方 中 的 
影像 信息 ， 利 用 机 器 学 习 分 类 模型 提出 了 发 现 错误 与 过 度 诊 治 的 检查 控制 机 制 与 解决 方案 。 该 方案 依托 医院 长 期 积累 
的 各 类 肿瘤 疾病 病历 中 的 CT、MRI 图 像 ， 以 每 次 诊疗 过 程 中 的 实际 肿瘤 类 型 为 依据 ， 从 医疗 数据 库 中 选择 对 应 类 型 
的 影像 数据 进行 特征 提取 、 特 征 选择 、 模 型 构建 ， 得 到 该 类 型 肿瘤 的 预测 分 类 器 ， 预 测 当 前 病例 的 良 恶 性 ; 并 通过 跟 
医生 诊断 结果 的 对 比 判 断 诊 疗 过 程 中 是 否 存 在 过 度 与 错误 医疗 问题 。 其 核心 是 提高 不 依赖 人 工 判 别 方法 的 判别 正确 率 
来 降低 肿瘤 类 疾病 的 错 诊 可 能 性 ， 通 过 实验 证 明 结 合 了 spearman 去 宛 余 方法 的 SVM_RFE 降 维 ， 与 传统 的 SVM_RFE 
方法 相 比 ， 在 肺 结 节 良 恶性 分 类 问题 的 SVM 模型 中 表现 更 佳 ， 同 时 也 优 于 传统 的 radiomics 方法 。 该 方案 能 及 时 发 现 
错误 与 过 度 医 疗 问 题 并 提出 预警 ， 发 挥 监督 提醒 的 作用 ， 在 实现 预防 和 避免 诊治 错误 的 同时 减少 对 人 工 鉴 别 的 依赖 ， 
为 错误 医疗 问题 及 减轻 患者 负担 提供 一 种 新 的 解决 途径 。 
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Abstract: Aimed at solving the problem of erroneous and excessive medical treatment of tumor diseases, this article extracted 
image information from similar medical record experts' prescriptions based on medical big data, and used a machine learning 
classification model to quantitatively analyze the level of medical treatment. The program relies on the CT, MRI images of 
tumor diseases accumulated in the hospital over a long period of time. Based on the tumor type in each treatment case, it 
selected the corresponding type of image data from the medical database for feature extraction and feature selection, to 
construct models to obtain a predictor for this tumor disease, to predict the benign and malignant of the current case, and to 
determine whether there are excessive and erroneous medical problems in the diagnosis process by comparing with the results 
of the doctor's diagnosis. The core of the method is to improve the accuracy of discriminating tumors without relying on 
human beings. Compared with the traditional SVM_RFE, the investigated method which combines SVM_RFE with the 
Spearman correlation has been experimentally proven to perform better in the SVM model of benign and malignant 
classification of pulmonary nodules. In general, it offers better performance compared with traditional radiomics method. The 
solution can detect erroneous and excessive medical treatment issues in real-time and provide warning, which can play a role 
in supervision and reminding. It potentially reduces the reliance on manual identification and minimizes the burden on patients 
while preventing and avoiding errors in diagnosis and treatment. 
Key words: error treatment; machine learning; spearman; SVM_RFE; SVM classifier 
全 国 肿瘤 登记 中 心 主任 陈 万 清 教 授 等 人 在 2016 年 1 月 发 表 的 文 
章 《Cancer statistics in China, 2015》 显示 ， 中 国 作为 拥有 13.7 
近年 来 ， 人 们 的 生活 环境 发 生 了 极 大 的 变化 ， 同 时 癌症 的 。 亿 人 的 人 口 大 国 , 在 2015 年 一 年 时 间 内 ， 预 计 有 429.2 万 新 发 
发 病 率 也 在 不 断 上 升 。 根 据 中 国医 学 科学 院 肿瘤 医院 赫 捷 院士 、 “肿瘤 病例 和 281.4 万 死亡 病例 。 这 其 中 肺癌 的 发 病 和 死亡 率 居 
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录用 稿 朱 诗 生 ， 等 : 肿瘤 类 疾病 的 过 度 与 错误 eS 彝 型 的 研究 


各 类 癌症 之 首 , 平均 每 1.2 min 就 有 一 个 中 国人 死 于 肺癌 趾 。 随 ” ”使 用 病历 中 的 影像 信息 ， 通 过 机 器 学 习 方 法 做 出 肿瘤 的 良 恶性 
着 科学 的 进步 和 治疗 手段 的 发 展 ， 人 类 面 对 各 种 疾病 时 有 了 更 。 预测， 与 医生 的 实际 诊断 做 对 比 形 成 评估 报告 ， 从 而 实现 对 可 
多 的 治疗 选择 ， 但 是 ， 各 种 药物 和 新 型 疗法 层出不穷 ， 医 疗 诊 ”能 出 现 的 错误 诊治 、 过 度 医疗 现象 做 出 预警 监督 ， 对 其 中 预测 
治 过 程 中 的 错误 与 过 度 医疗 问题 日 益 严 重 。 错 误 与 过 度 医疗 是 。 结果 与 实际 诊断 差异 较 大 ， 出 现 错误 诊治 率 高 于 闵 值 的 评估 结 
指 在 诊治 过 程 中 ， 医生 主观 或 疏忽 而 导致 患者 病情 更 加 严 ， 果 提 交 上 级 监管 部 门 ， 帮 助 医生 及 时 发 现 潜 在 的 错误 与 过 度 医 
重 或 加 重 患 者 负担 的 情形 ， 这 其 中 包括 但 不 限于 错误 诊断 、 错 。 ” 疗 问 题 ， 避 和 免 该 类 问题 的 发 生 。 该 方案 的 目的 是 通过 基于 影像 
误 用 药 、 手 术 失 误 等 外。 组 学 的 方法 对 大 量 肿瘤 类 病症 进行 数据 挖掘 ， 对 诊治 过 程 是 否 

肿瘤 疾病 死亡 率 高 ， 治 疗 开销 大 ， 其 错误 诊治 将 给 病人 带 ”存在 过 度 与 错误 医疗 问题 提出 一 种 科学 规范 的 评判 解决 机 制 。 
来 极 大 的 痛苦 和 负担 。 目 前 临床 上 对 肿瘤 的 良 恶性 的 初步 诊断 旨 在 提高 评判 标准 的 客观 性 和 合理 性 , 减少 对 人 工 鉴 别 的 依赖 ， 


中 


本 


主要 依靠 医生 的 主观 经 验 与 某 些 临床 特征 的 相 结合 ， 在 医生 诊 具体 的 监控 流程 框架 如 图 1 所 示 。 
断 怀疑 是 恶性 肿瘤 之 后 才 会 做 进一步 确认 。 对 于 良性 肿瘤 病人 个 [二 二 
而 言 ， 被 误 判 为 恶性 肿瘤 所 做 的 一 系列 复 检 和 治疗 实际 上 是 过 证 
度 医疗 ， 而 被 误 判 为 良性 的 恶性 肿瘤 病人 则 可 能 错失 尽早 治疗 EE pane 
的 良机 。 因 而 解决 肿瘤 的 良 恶 性 分 类 问题 成 为 减少 肿瘤 类 疾病 wR 
的 错误 与 过 度 医疗 问题 的 关键 。 a 
错误 医疗 由 于 其 偶发 性 及 评判 标准 的 模糊 性 ， 长 期 以 来 该 
领域 的 研究 并 没有 太 多 突破 性 的 进展 。 一 些 国家 主要 依靠 道德 
约束 和 与 论 压力 减少 错误 与 过 度 医疗 现象 ， 或 者 是 通过 规范 化 
用 药流 程 ， 将 药品 的 使 用 置 于 专业 医疗 人 员 的 监督 控制 下 ， 来 ET Ey 
预防 和 避免 错误 用 药 和 滥用 药品 问题 的 发 生 ， 并 未 能 从 技术 手 图 1 过 度 与 错误 诊治 问题 发 现 机 制 与 方法 的 流程 框架 
段 上 实现 对 错误 与 过 度 医疗 的 监控 与 管理 可。2012 年 Lambin 从 上 图 展示 的 错误 与 过 度 医疗 问题 发 现 机 制 与 方法 流程 框 
参与 程度 高 的 诊治 流程 与 诊治 


教授 提出 的 radiomics 影像 组 学 理念 在 医疗 科研 工作 者 中 掀起 ” 架 可 看 出 ， 该 框架 主要 是 将 医生 

股 基于 医疗 图 像 预测 疾病 类 型 的 热潮 。 接 下 来 的 几 年 ， 对 于 ”结果 的 评价 流程 分 离开 来 ， 尽 量 降 低 评估 报告 中 人 为 因素 的 影 
中 瘤 类 重大 疾病 ， 一 种 基于 图 像 分 析 结 合 统计 学 线性 回归 方法 。 响 ， 提 高 最 后 得 到 的 评估 报告 的 客观 性 。 通 过 基于 医疗 数据 库 
来 预测 疾病 程度 的 研究 被 许多 研究 者 不 断 推进 ， 旨 在 改变 传统 中 大 量 已 有 病历 的 影像 数据 ， 提 高 预测 评估 模型 的 可 重复 性 和 
医生 诊断 肿瘤 良 恶 性 只 能 依靠 读 片 经 验 的 现状 外 。 此 类 预测 模 ”可 信和 度 。 肿瘤 病人 到 医院 就 诊 , 医生 将 结合 病人 对 病症 的 描述 ， 
型 的 构建 正 是 肿瘤 类 疾病 过 度 与 错误 医疗 问题 解决 方案 的 突破 ” 以 及 相关 的 一 系列 医疗 检查 ， 最 后 根据 检查 结果 和 个 人 的 知识 
，2016 年 学 者 Carneiro 通过 基于 CT 图 像 对 老年 人 5 年 内 死 ” 经验 作 出 诊断 ， 与 其 他 信息 一 起 形成 了 该 次 诊治 的 实际 病历 ， 
亡 率 的 预测 ， 展 示 了 机 器 学 习 的 非 线 性 分 类 方法 在 疾病 预测 方 。 病历 中 就 包含 了 CT 图 像 、MRI ed 


向 上 的 潜力 和 优势 后 ， 为 错误 医疗 问题 的 解决 提供 了 另 一 种 思 该 病历 的 具体 肿瘤 类 型 作为 过 滤器 的 输入 ， 通 过 过 滤器 对 
路 。 医疗 数据 库 中 的 多 种 肿瘤 影像 数据 进行 有 效 得 选 、 特 征 提取 ， 
本 文 的 研究 重点 是 基于 肿瘤 类 病人 病历 构建 可 信 度 高 的 良 ”用 于 下 一 步 的 机 器 学 习 ， 目 的 是 建立 与 实际 诊断 结果 相对 应 类 


恶性 分 类 模型 ， 降 低 过 度 与 错误 医疗 的 发 生 概率 。 对 于 收集 的 ”型 肿瘤 的 预测 分 类 模型 ， 而 病历 中 的 影像 数据 部 分 ， 之 后 则 作 
194 例 肺 结 节 病 例 ,文中 先 使 用 当前 比较 主流 的 radiomics 方法: ”为 该 预测 模型 的 输入 样本 ， 提 取出 图 像 多 类 特征 属性 的 离散 或 
从 病历 包含 的 医学 图 片 中 提取 Texture 特征 、lasso regression 降 连续 值 ， 放 入 训练 好 的 预测 模型 predictor 中 进行 预测 分 类 ， 根 
维 、logistics regression 建 模 ， 使 用 ROC 曲线 对 该 模型 进行 评 。 据 分 类 结果 与 输入 端的 临床 良 恶 性 指标 即 实际 诊断 结果 的 异 
估 ; 再 在 降 维和 建 模 的 环节 中 采用 其 他 统计 和 机 器 学 习 方 法 ， 同 ， 得 到 此 次 诊治 过 程 是 否 存 在 错误 医疗 现象 的 预 判 。 实 际 诊 


得 出 不 同 的 特征 选择 方法 与 建 模 方案 在 该 问题 上 的 综合 比较 。 断 和 预测 结果 不 同 将 被 判定 为 可 能 存在 错误 医疗 的 诊治 流程 ， 

最 终 得 到 引入 spearman 去 元 余 方 法 后 ,SVM_RFE 降 维和 SVM 会 在 预警 评估 报告 中 指出 错误 诊治 存在 的 可 能 性 。 二 者 相同 
分 类 器 结合 的 模型 在 肺 结 节 良 恶性 鉴别 的 问题 上 表现 最 佳 的 结 。 则 该 病历 被 判定 不 存在 错误 和 过 度 医疗 情况 ， 图 1 的 过 度 医疗 
论 。 发 现 机 制 将 认为 此 次 诊治 流程 是 规范 的 ， 该 病历 中 的 影像 数据 


WE Ne 和 诊断 结果 应 该 作为 可 信赖 的 新 样本 添加 入 医疗 数据 库 中 ， 医 

1 ”过 度 与 错误 医疗 问题 发 现 机 制 的 框架 研究 疗 数据 库 中 除了 保留 该 病历 的 影像 数据 之 外 ， 还 将 保留 该 次 诊 
本 研究 在 整理 大 量 肿瘤 类 疾病 的 医疗 数据 ， 深 入 调查 理解 。” 断 结果 即 临 床 良 恶 性 指标 作为 其 对 应 的 建 模 标签 。 

医院 医疗 流程 的 基础 上 ， 提 出 了 针对 肿瘤 类 疾病 错误 与 过 度 诊 如 图 1 所 示 ， 医 疗 数据 库 是 预测 模型 建立 的 基础 ， 其 中 除 

治 的 检查 控制 机 制 模 型 与 方法 ， 该 机 制 将 从 病人 的 病历 入 手 ， ”存储 病理 、 药 物 知 识 ， 还 包括 病案 专家 处 方 库 ， 数 据 库 需要 不 


到 


201808.00125v1 


chinaXiv 


录用 稿 


断 积累 ， 此 环节 因 篇 幅 不 做 展开 。 实 际 诊治 中 各 类 型 疾病 所 对 


应 的 检测 项 目 不 同 ， 因 此 得 到 的 病理 参数 也 不 一 致 。 


液 检查 ， 得 到 的 病理 数据 则 是 结构 化 的 文本 数据 ， 


患 有 肿瘤 的 病人 需要 做 CT 或 MRI 扫描 ,得 到 的 病理 数据 为 非 
结构 化 的 图 像 数 据 ， 而 疑似 病毒 性 感冒 的 患者 则 需要 做 常规 的 


目 组 开发 的 协同 诊治 平台 对 此 已 做 了 方案 设计 中。 本 文 针 对 的 
疾病 类 型 是 肿瘤 ， 因 此 只 考虑 医疗 数据 库 中 的 肿瘤 类 疾病 数据 
的 积累 。 在 医疗 数据 库 建 立 的 初期 ， 为 了 保证 所 建立 模型 的 正 
确 性 ， 需 要 以 绝对 可 信 的 样本 为 初始 训练 集 ， 因 此 一 开始 数据 
库 中 保存 的 肿瘤 影像 数据 必须 来 源 于 最 终 做 了 手术 切除 的 病 


例如 可 能 


本 研究 项 


例 ， 以 肿瘤 切除 后 病理 证 实 的 结果 作为 影像 的 对 应 金 指标 。 


2 ”过 度 与 错误 医疗 问题 建 模 方法 研究 


2.1 过 度 与 错误 医疗 问题 分 类 模型 


朱 诗 生 ， 等 : 肿瘤 类 疾病 的 过 度 与 错误 疗 检查 控制 机 和 与 楼 型 的 研究 


wT"x+b>0; 若 不 属于 分 类 标 疾病 yl， 则 jw xX+b<0。 令 


下 
| yi y1 (3) 


w x+b<-l, y,= yo; 


使 得 上 式 成 立 的 训练 样本 点 ， 即 对 应 的 病历 影像 数据 ， 它 
们 被 称 为 "支持 向 量 "， 两 个 异类 支持 向 量 到 超 平面 的 距离 之 和 
为 


2 


出 


它 被 称 为 “间隔 ”171。 

所 需 过 度 与 错误 医疗 问题 分 类 模型 的 工作 流程 为 根据 病历 
中 所 描述 的 肿瘤 疾病 类 型 结合 其 对 应 的 影像 数据 构建 分 类 器 。 
CT 或 MRI 图 像 的 采集 目的 在 于 尽 可 能 正确 的 识别 出 恶性 的 肿 


普 误 与 过 度 医 疗 问题 解决 的 重点 在 于 建立 可 靠 的 分 类 模 


型 , 来 判定 医生 的 实际 诊断 中 是 否 存在 诊治 错误 。 文 


持 向 量 机 ， 


英文 名 为 support vector machine， 简 称 SVM， 是 一 种 二 类 分 类 


模型 ,其 基本 模型 定义 为 特征 空间 上 的 间隔 最 大 的 线 


性 分 类 器 ， 


其 学 习 策 略 便 是 间隔 最 大 化 ， 最 终 可 转化 为 一 个 凸 二 次 规划 问 


所 


题 的 求解 , 契合 过 度 和 错误 医疗 问题 对 肿瘤 良 恶性 分 
本 文 将 把 该 理论 模型 用 于 解决 错误 医疗 的 问题 。 


依据 文献 [7] 中 所 述 支 持 向 量 机 原理 ,给 定 某 种 肿瘤 疾病 的 


良性 样本 和 该 类 肿瘤 的 恶性 样本 作为 总 体 训练 样本 外 


各 类 图 像 特征 参数 ，yi 表示 该 病历 所 对 应 患者 的 真实 肿瘤 良 亚 
性 级 别 , 分 类 学 习 最 基本 的 想法 就 是 基于 训练 集 D 在 样本 空间 


ED={ (x1, 


ylD)，(x，y2)., (Xm，ym)}， 其 中 xi 是 由 病历 中 影像 数据 提取 的 


瘤 病例 ， 因 此 我 们 在 医疗 数据 库 中 挑选 一 定数 量 的 某 类 肿瘤 恶 
性 病例 的 影像 数据 作为 SVM 训练 的 正 样本 集 ， 另 选取 数量 相 
等 的 该 类 肿瘤 良性 病例 的 影像 数 作 为 训练 集中 的 负 样 本 
过 对 这 些 数 据 的 训练 ， 寻 找到 最 优 划分 超 平面 ， 即 获得 最 终 的 
预测 模型 ， 用 于 鉴别 肿瘤 的 良 恶性 ， 并 以 此 预测 结果 和 医 
断 的 异同 作为 是 否 存 在 过 度 与 错误 医疗 的 评判 依据 。 
2.2 疾病 分 类 特征 选择 算法 
考虑 到 某 些 重大 疾病 获得 的 临床 特征 较 多 ， 特 别 是 采集 影 
像 数据 的 肿瘤 类 疾病 ， 可 获取 的 基于 图 像 的 特征 信息 量 巨 大 ， 
在 使 用 SVM 建立 预测 模型 时 容易 因为 训练 样本 的 数据 维度 过 


Nn 


凡 A 


如 


中 找到 一 个 划分 超 平面 ， 将 不 同类 别 的 诊治 样本 分 开 。 标 记分 
类 目标 疾病 为 yy， 其 他 类 型 疾病 Y2.……ym 统一 标记 为 Y0， 我 


们 的 理想 目标 是 寻找 位 于 y0 和 yl 两 类 训练 样本 “ 正 


中 间 ” 的 划 


分 超 平 面 ， 在 样本 空间 中 ， 划 分 超 平面 可 通过 如 下 线性 方程 来 


者 述 [: 


Ww'x+b=0 


(1) 


高 产生 过 拟 合 现象 ， 最 终 影响 分 类 模型 的 泛 化 能 力 ， 因 此 对 让 
练 数 据 进 行 特征 选择 至 关 重 要 。 临 床 信息 类 别 较 多 较 复 杂 的 疾 
病 ， 特 征 选 择 能 够 减少 待 处 理 的 数据 量 ， 降 低 计 算 复杂 度 ， 缩 
短 建 立 模型 的 时 间 消 耗 ， 同时， 并 不 是 所 有 的 特征 属性 都 能 对 
预测 模型 起 到 正面 作用 ， 特 征 选择 能 够 降低 数据 维度 ， 将 具有 
干扰 性 的 特征 筛选 出 来 ， 从 而 提高 错误 医疗 分 类 模型 的 预测 准 
确 率 。SVM_RFE 特征 选择 算法 是 一 种 以 文 持 向 量 机 为 基础 的 
特征 排序 选择 算法 钙 。 该 算法 的 实现 分 为 以 下 三 个 步骤 : 

a) 使 用 包含 多 个 临床 特征 参数 的 待 训练 数据 集训 练 支持 向 
量 机 ， 获 得 SVM 正则 项 的 拉 格 朗 日 算 子 向 量 ， 即 分 类 器 参数 ; 


其 中 ， 四 = (@ ;0@);0@3;.…; 4;) 为 法 向 量 ， 决 定 了 超 平面 的 


方向 ，b 为 位 移 项 ， 决 定 了 超 平面 与 原点 之 间 的 距离 。 显 然 划 


分 超 平面 可 被 法 向 量 O 与 位 移 b 确定 ， 下 面 我 们 将 其 记 为 


(@,5)。 样本 空间 中 任意 点 到 超 平面 (@,5) 的 距离 可 写 为 


or + 
f= 


lol 


假设 超 平面 (@,5) 能 将 y0 和 yl 两 类 训练 样本 


(2) 


E 确 分 类 ， 


即 对 于 (wi,y,)eD ，y; 若 属于 分 类 目标 疾病 yi， 则 有 


= SVM —train(X,y) (5) 


b) 计 算 每 个 特征 向 量 即 临床 指标 参数 在 输入 空间 中 的 权重 
向 量 ， 得 到 完整 支持 向 量 机 的 权重 ; 


VS 2 (6) 


c) 使 用 合适 的 排序 方法 将 数据 集 里 的 权重 向 量 进行 排序 并 
删除 贡献 率 最 小 的 特征 ， 这 说 明 该 项 指标 在 正确 分 类 目标 疾病 
的 过 程 中 作用 最 低 ， 直 到 最 后 数据 集中 只 剩 下 一 个 特征 。 


I 


2 限 人 
R =i@0 -ww 


C 


(07) 
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正确 地 将 疾病 分 类 ， 就 肿瘤 论 ， 若 能 有 效 降 低 肿瘤 类 重大 型 疾 
病 在 诊治 过 程 的 错误 医疗 问题 ， 对 患者 意义 重大 ， 既 能 减少 无 
了 第 p 个 特征 之 后 支持 向 量 机 的 权重 中。 谓 的 花费 ， 又 能 及 时 接受 合适 的 治疗 。 当 前 影像 组 学 一 大 研究 
这 种 特征 排序 的 方法 基于 SVM 在 训练 过 程 中 产生 的 特征 方向 是 从 肿瘤 影像 数据 出 发 ， 依 靠 计算 机 领域 的 图 像 处 理 技 术 
权重 ， 选 出 来 的 参数 与 分 类 结果 相关 性 大 ， 因 此 与 SVM 分 类 ”和 统计 学 领域 的 统计 分 析 、 线 性 回归 等 方法 构造 出 肿瘤 疾病 的 
器 配合 使 用 有 和 较 好 的 预测 效果 。 但 显然 在 上 述 的 特征 排序 过 程 。 分 级 和 分 类 模型 ， 将 肿瘤 疾病 的 预测 与 临床 医学 经 验 知识 的 积 
中 ， 使 用 的 是 特征 逐次 减少 的 方法 ， 并 不 能 充分 考虑 特征 之 间 。” 累 相 剥 离开 ， 评 估 这 种 预测 方案 的 准确 性 和 AUC 等 指标 。 近 
的 相互 联系 ， 可 能 出 现 某 几 个 相关 程度 高 的 特征 同时 排 在 序列 。” 些 年 来 radiomics 领域 较为 流行 的 方法 , 主要 分 为 如 图 3 所 示 的 
前 段 , 挤 压 特征 选择 空间 ， 从 而 不 能 找到 最 优 特征 组 合 的 情况 。 ”四 个 步骤 a) 数据 预 处 理 ， 包 括 CT/MRI 图 像 的 采集 ， 专 业 医 
对 此 ， 本 文采 取 在 SVM_RFE 特征 选择 算法 之 前 先 使 用 生 对 感 兴趣 区 域 (一 般 是 病灶 区 〉 的 勾画 ， 和 基于 灰 度 值 图 像 
spearman 基于 相关 性 去 元 余 的 方法 ， 删 除 特 征 中 相关 程度 高 的 ”的 特征 提取 ; b) 为 了 获得 线性 模型 的 稀 玻 化 可 行 解 ， 使 用 lasso 
部 分 特征 。 regression 对 上 一 步 提取 的 特征 做 降 维 ; c) 基 于 步骤 b) 中 挑选 出 


四 2 表示 的 是 整个 支持 向 量 机 的 权重 ，m-(P) 则 表示 剔除 


去 


、 上 二 来 的 特征 参数 ， 使 用 logisti ion 构建 肿瘤 良 恶 性 分 类 
3 ”结合 spearman 的 SVM 方法 与 传统 radiomics 方 风 本 a 、 Wy ne 中 - 人 
法 的 异同 型 ，d) 使 用 留 出 的 验证 集 部 分 数据 对 步 又 三 所 构造 的 模型 进行 
a 评估 ， 采 用 包括 预测 的 准确 率 、 预 测 样本 的 灵敏 度 和 特异 度 等 
3.1 训练 数据 的 提取 流程 多 重 指标 对 该 模型 的 泛 化 能 力 进行 总 体 评价 5。 
前 文 介绍 了 基于 SVM 的 错误 医疗 问题 建 模 方法 ， 接 下 来 @ 
要 解决 的 问题 就 是 获得 高 质量 的 训练 数据 ， 以 保证 最 后 获得 巴 有 家 从 
»。 lasso * ACC、 AUC Pe 
测 模 型 的 泛 化 能 力 。 上 文 的 框架 描述 中 已 提 到 模型 的 训练 数据 三 二 和 @ 多 (©) 
数据 预 处 理 2 模型 构建 4 2 
来 源 于 医院 数据 库 中 己 有 肿瘤 病历 的 影像 数据 ， 具 体 流 程 如 图 logistic regression 


2 所 示 。 9 


OO 图 3 ”基于 radiomics 方法 的 肿瘤 分 类 模型 
病历 WO 训练 数据 、 、 
人 不 3.3 基于 SVM 和 相似 专家 处 方 的 疾病 预测 模型 构建 
交互 筛选 
| 本 文 所 研究 疾病 肺 结 节 的 CT 影像 数据 如 图 4 所 示 ， 图 4 
医疗 大 数据 库 中 左 圈 出 位 置 可 见 病 娄 区 域 占 比 很 小 ， 图 右 是 放大 多 倍 以 后 的 
= 结 节 3D 图 像 ， 医 生 单 赁 这 些 影像 信息 判断 结 节 的 良 恶性 难度 
临床 特征 图 像 处 方 医学 知识 库 影像 数据 库 
= 很 大 ， 容 易 导 致 错误 医疗 情况 的 发 生 。 
图 2 基于 相似 专家 处 方 的 训练 数据 提取 流程 


到 2 是 基于 医疗 数据 库 中 大 量 已 有 病历 提取 训练 数据 集 的 
模型 ， 其 中 病理 、 药 物 知识 库 用 于 存储 从 医学 专家 那里 得 到 的 
针对 某 类 疾病 的 专门 知识 和 经 验 ， 以 及 医院 长 年 累 月 积累 下 来 
的 优秀 病历 及 处 方 ， 数 据 库 的 丰富 性 和 数据 正确 性 直接 关系 到 


最 终 预 测 模型 的 可 信 度 ,数据 的 表现 形式 为 规范 化 的 病历 数据 ， 图 4 实验 所 用 肺 结 节 CT 图 像 
其 内 容 主 要 有 : 病人 信息 、 病 症 描 述 、 病 理 参数 、 医 生 诊断 医 由 于 人 体 各 个 组 织 的 病灶 在 医学 图 像 上 有 不 同 的 表现 ， 相 


嘱 00 ， 以 及 非 结 构 化 的 影像 数据 。 预 测 模型 的 构建 是 以 待 评 似 病例 的 临床 特征 尤其 是 影像 数据 搜集 较为 困难 ， 这 也 使 得 可 
估 病 人 的 实际 患 病 类 型 为 依据 ， 通 过 人 机 交互 从 医疗 数据 库 中 用 于 模型 训练 的 样本 量 不 够 大 ， 更 适合 用 小 样本 分 类 表现 良好 
提取 出 一 定数 量 该 类 肿瘤 恶性 病例 的 影像 数据 作为 训练 集 的 正 的 机 器 学 习 方 法 。 本 研究 建 模 流 程 为 : g) 收 集 处 方 中 已 得 出 良 
样本 ， 并 取出 数量 相等 的 该 类 肿瘤 良性 病例 影像 数据 作为 负 样 恶性 病理 标签 的 肿瘤 CT 图 像 数据 N 例 ， 将 其 随机 划分 成 训练 
本 ; 对 这 些 从 数据 库 中 随机 挑选 出 来 的 待 训练 样本 集 进行 特征 集 数 据 x 例 和 验证 集 数据 y 例 ;b) 全 部 样本 通过 图 像 识 别 的 方 
提取 ,通过 结合 了 spearman 去 见 余 方法 的 组 合 SVM-RFE 特征 法 提取 出 GLCM、GLRLM、Histogram、Form factor 四 类 纹理 
选择 算法 进行 数据 降 维 ， 降 维 后 的 结果 用 于 构建 SVM 分 类 器 ， 参数 共 M 个 ， 得 到 N*M 的 特征 值 和 矩阵，c) 基 于 训练 集 样本 进 
因此 ， 医 疗 数据 库 中 训练 数据 的 规范 收集 和 积累 是 分 类 器 预测 行 特征 工程 , 结合 spearman 方法 筛选 出 对 模型 分 类 最 有 效 的 部 


mi 


效果 的 保障 。 分 特征 m 个 ， 特 征 值 矩 阵 降 维 到 N*m， 降 维 后 的 部 分 数据 如 
3.2 ”基于 传统 radiomics 方法 的 肿瘤 分 类 模型 构建 图 5 所 示 ; d)P 基于 x 例 训练 样本 构建 SVM 分 类 模型 ,用 y 例 
如 前 文 所 述 ， 错 误 医 疗 问题 的 解决 关键 在 于 依据 病理 指标 验证 集 样本 对 该 模型 进行 验证 ,评估 模型 的 疾病 分 类 预测 能 
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D E F 


G 


H 
label ”MeanValutstdDeviatk Variance “VolumeColVoxelValue Range RMS 
0 12 542 


1 0.017474 
1 0.034131 


1.1 0.000135 0.000155 1.89E+08 
27815.8 0.000424 0.00102 3.3E+08 
18932.6 0.001794 0.003115 3.52E+08 
19031.7 0 0.001776 3.8E+08 
15001.2 0.000634 0.001363 53500000 
22188.5 0.000196 0.000369 1.16E+08 
30315.4 7.91E-06 2.80E-05 1.52E+08 
23587.6 0.000237 0.00013 1.43E+08 
24242.9 0.000132 0.000169 1.09E+08 
33702.3 7.56E-06 1.03E-05 87200000 
29989.1 1.29E-05 1.60E-05 16100000 

25732 8.06E-05 0.000246 1.87E+08 
34417.3 3.67E-05 2.53E-05 90900000 


23 13908.9 0.000299 0.000643 87300000 


S 
8 
个 
四 


0 0.005133 


31257.2 0.00049 0.00147 1.32E+08 
25338.6 6.77E-05 0.00011 1.51E+08 


35421.1 0.997243 
27815.8 0.989583 
18932.6 0.980263 
19031.7 0.984375 
15001.2 0.991071 
22188.5 0.994898 
30315.4 0.999232 
23587.6 0.99717 
24242.9 0.995455 
33712.7 0.999483 
29993.8 0.999486 

25732 0.996445 
34417.3 0.998996 
13908.9 0.993697 
31257.2 0.988806 
25338.6 0.996988 


图 5 降 维 之 后 的 训练 


数据 集 


27815.8 
18932.7 
19031.8 
15001.2 
22188.5 
30297.8 
23587.6 
24242.9 


33695.1 


29991.3 2 


25732.1 
34399.2 
13908.9 
31257.2 
25338.6 


1 J 
MeanDevi RelativeDe: 
35421.1 21.6536 


63.1897 


3.4 结合 spearman 的 SVM 方法 与 传统 radiomics 方法 的 比 


较 


3.1 与 3.2 节 对 传统 radiomics 方法 与 结合 
SVM 方法 的 步骤 说 明 可 知 , 两 种 方法 作用 


了 spearman 的 
于 肿瘤 疾病 过 度 与 错 


误 医 疗 检查 控制 机 制 的 方式 是 相同 的 ， 都 是 从 数据 库 中 获取 影 


像 数据 ， 反 馈 良 恶性 预测 结果 。 且 两 种 方法 在 数 


的 预 处 理 、 


特征 提取 以 及 最 后 模型 评估 环节 基本 相同 ， 不 同 之 处 在 于 特征 


降 维 和 分 类 器 构建 。Radiomics 方法 构 妈 


模型 : logistic regression， 并 在 特 利 


Ht 


用 了 lasso regression: 带 L1 约束 的 线 4 
具备 相关 性 去 元 余 功 能 ; 


方法 在 建 模 环 节 采 


并 在 特征 降 维 环 
SVM_RFE 非 线性 的 降 旨 


4 ”实验 验证 及 结果 说 明 


本 文采 用 中 上 


工程 环节 为 了 


影像 数据 作为 实验 样本 ， 通 过 实验 与 


上 也 能 


E 的 是 一 般 的 线性 回归 
得 稀 下 C 解 采 
生 回归 模型 , lasso 本 身 不 
本 文 使 用 的 结合 了 spearman 
用 了 带 高 斯 核 的 SVM 分 类 器 ， 一 利 
的 分 类 器 ， 在 线性 可 分 程度 不 高 的 数据 外 
不 节 结 合 使 用 spearman 相关 性 
住 排序 法 更 大 程度 的 


的 SVM 


良好 表现 ， 
去 元 余 方法 , 通过 
呆 留 了 有 效 特 征 。 


非 线性 


上 大 学 第 五 附属 医院 收集 的 194 例 真实 肺 结 节 
般 的 SVM 方法 和 传统 


的 radiomics 方法 两 两 比较 ， 并 且 对 实验 结果 进行 了 可 视 化 呈 


现 ， 一 定 程度 上 验证 了 本 文 所 提出 的 检查 控制 机 制 与 模型 的 合 


适用 性 研究 。 


理性 和 科学 性 。 当 然 ， 该 方案 在 临床 应 用 之 前 还 需要 做 更 多 的 


本 次 验证 实验 的 主要 过 程 分 为 三 个 步 又， 分 别 是 对 数据 的 


预 处 理 、 特 征 降 维 与 建 模 、 模 型 的 评估 与 比较 。 用 


分 别 对 3 个 模型 做 评估 预测 后 , 最 终 
改进 SVM 模型 在 59 例 验证 数据 


的 分 类 预测 准确 率 。 
4.1 实验 数据 划分 及 预 处 理 


实验 总 样本 为 用 


证 ， 验 证 集中 


十 
结合 


结 节 病 例 数据 194 例 ， 其 中 
例 ， 恶 性 结 节 55 例 ， 实 验 采 用 常用 的 7: 3 作为 训练 外 
集 的 划分 比例 ,按照 正 负 样本 比例 随机 选取 135 例 
训练 集中 良性 结 节 98 个 ， 恶 性 结 节 37 个 ; 59 例 用 于 做 模型 验 
良性 结 节 41 个 ， 恶 性 结 节 18 个 ; 对 | 


样本 通过 图 像 处 理 


良 怕 


验证 
了 spearman 去 宛 余 的 
FP 表 现 最 佳 ， 达 到 了 89.83% 


集 样本 


E 结 节 139 


与 验证 


用 于 做 训练 ， 


上 述 收集 的 
方法 获取 GLCM、 GLRLM、 Histogram、 Form 


factor 四 类 纹理 


特征 共 330 个 ， 篇 册 


取 过 程 。 接 着 分 别 


化 和 异常 值 均 


原因 本 文 不 台 
对 提取 出 来 的 训练 集 和 验证 集 


值 填充 处 理 ， 赋 予 恶 性 肿瘤 数据 0 类 标签 ， 良 性 


数据 进行 标准 


述 特征 的 提 
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肿瘤 的 标签 设置 为 1。 数 据 划 分 和 预 处 理 之 后 所 得 样本 的 具体 
分 布 如 表 1 所 示 。 


表 1 实验 数据 划分 结果 


标签 0 类 1 类 总 计 / 例 
训练 数据 37 98 135 
验证 数据 18 41 59 


4.2 特征 降 维 与 建 模 
本 实验 的 数据 降 维 操作 仅 使 用 训练 集 数据 作为 降 维 数据 依 
据 ， 全 过 程 不 涉及 到 验证 集 数 据 ， 仅 在 模型 评估 环节 将 降 维 步 
又 选中 的 特征 在 验证 集 样本 中 对 应 挑 出 ,用 作 每 个 模型 的 输入 。 
首先 根据 传统 的 radiomics 方法 基于 135 例 特征 维度 为 330 的 训 
练 数据 ， 使 用 lasso 算法 降 维 ， 直 接 获 得 维度 为 10 的 稀 疏 解 ， 

且 在 闪 值 选取 为 0.795 时 获得 最 大 收益 ， 此 时 训练 集 准 确 率 
为 91.11%。 然 后 基于 同样 的 数据 集 ， 重 新 使 用 spearman 方法 
基于 相关 性 去 元 余 ， 在 相关 度 阔 值 设 为 0.85 时 ， 剩 余 特征 个 数 
49; 将 训练 集 的 标签 及 49 个 特征 构成 的 135*50 特征 值 矩 阵 作 
为 输入 ， 使 用 SVM_RFE 算法 进行 降 维 排序 ， 最 后 对 有 序 的 特 
征 进行 逐步 回归 建 模 ， 由 于 支持 向 量 机 的 特征 增加 过 程 中 存在 
休 斯 效 应 4， 通过 对 训练 集 做 十 折 交 叉 验 证 发 现在 特征 个 数 选 
取 为 42 时 模型 表现 达到 最 佳 , 此 时 模型 在 训练 集 上 的 内 部 验证 
准确 率 为 97.78%， 故 选取 该 42 个 特征 用 于 最 后 建 模 。 同 理 对 
未 经 过 spearman 降 维 处 理 的 330 个 初始 特征 做 SVM_RFE 降 维 
排序 , 通过 交叉 验证 发 现在 特征 个 数 选取 为 32 时 模型 表现 达到 
最 佳 ， 此 时 的 内 部 验证 准确 率 为 97.78%， 故 选取 该 32 个 特征 


用 于 传统 SVM 建 模 。 有 具体 结果 如 表 2 所 示 。 
表 2 三 种 不 同 降 维 与 建 模 方法 在 训练 集 上 的 实验 结果 
降 维 与 建 模 方法 保留 特征 个 数 准确 率 
Lasso+LR 10 91.11% 
SPpr+RFE+SVM 42 97.78% 
SVM_RFE+SVM 32 97.78% 


4.3 模型 评估 与 比较 
首先 本 实验 根据 SVM_RFE 选 出 的 32 个 特征 ,使 用 带 高 斯 
核 的 支持 向 量 机 对 训练 集 建 模 获 得 模型 m0， 再 将 训练 集中 
spearman+SVM_RFE 选中 的 42 特征 同样 使 用 高 斯 核 SVM 建 模 
得 到 模型 ml1，lasso 选 出 的 10 个 特征 ， 使 用 logistics regression 
对 训练 集 建 模 获 得 模型 m2。 为 了 获得 拟 合 能 力 和 泛 化 能 力 都 
足够 优秀 的 模型 ， 分 别 将 训练 集 和 验证 集 数 据 依 次 带 入 三 个 模 
型 ， 通 过 ROC 曲线 、 准 确 率 、AUC、 灵 敏 度 和 特异 度 五 个 指 
标 对 模型 进行 综合 评估 。 图 6 和 7 分 别 是 三 个 模型 在 训练 集 和 
验证 集 上 的 ROC 曲线 ， 由 图 中 曲线 可 知 三 个 模型 在 训练 集 的 
分 类 预测 上 表现 非常 接近 ， 并 且 都 表现 优秀 ， 因 此 可 以 认为 三 
个 模型 的 拟 合 能 力 都 很 强 ， 差 异 不 大 。 在 验证 集 上 三 个 模型 的 
ROC 曲线 都 远离 横 纵 轴 对 角 线 ,这 是 泛 化 能 力 良 好 的 表现 , 但 
条 曲线 出 现 了 较 明 显 的 差异 ， 未 使 用 spearman 降 维 的 模型 
mo0 的 曲线 被 使 用 了 该 方法 的 ml 包围 ， 说 明 ml 模型 在 验证 集 
上 的 表现 优 于 m0; 基于 SVM 方法 的 模型 与 基于 logistics 
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regression 的 影像 组 学 模型 有 交点 , 需要 通过 更 多 的 指标 进行 评 
估 。 


The ROC of training set 


SVM_RFE*SVM 
~ sp"RFE*SVM | 
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图 6 三 种 不 同方 法 在 训练 集 上 的 ROC 曲线 


The ROC of testing set 


图 7 三 种 不 同方 法 在 验证 集 上 的 ROC 曲线 
为 了 进一步 比较 三 个 模型 的 泛 化 能 力 差异 ， 本 实验 考察 了 
各 模型 在 准确 率 、AUC、 灵 敏 度 和 特异 度 上 的 表现 ， 详 细 数 据 
见 表 3。 由 于 SVM 模型 构建 的 超 平面 到 不 同类 别 支 持 向 量 是 等 
间隔 的 ， 不 存在 阔 值 变化 ， 因 此 得 到 ROC 曲线 与 逻辑 回归 不 
同 ， 不 存在 很 多 打点 ， 因 此 难以 从 AUC 值 上 与 传统 radiomics 
模型 做 出 比较 ， 但 在 预测 准确 率 和 临床 灵敏 度 上 有 较 显 著 的 优 
势 。 为 了 再 进一步 说 明 模 型 ml 优 于 其 他 两 个 模型 ， 实 验 最 后 
通过 三 者 的 临床 决策 曲线 将 各 模型 的 决策 净 收 益 进行 了 可 视 
化 ， 如 图 8 所 示 。 
表 3 三 个 模型 在 验证 集 上 的 评估 指标 数据 


模型 准确 率 AUC 灵敏 度 特异 度 
m0 84.75% 0.812 0.902 0.722 
ml 89.83% 0.849 0.976 0.722 
m2 84.75% 0.900 0.889 0.829 

] NN 
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图 8 三 种 不 同方 法 在 验证 集 上 的 临床 决策 曲线 
图 8 中 三 条 决策 曲线 可 以 看 出 ,在 闵 概 率 0.2~0.85 区 间 ， 
模型 ml 的 决策 净 收 益 要 显著 高 于 另外 两 个 模型 ， 并 且 可 选 闹 
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概率 范围 连续 并 足够 大 ， 是 良好 的 判断 指标 。 综 上 ， 实 验证 明 
结合 了 spearman 去 元 余 算 法 及 SVM_RFE 降 维 排序 算法 的 
SVM 模型 , 能 够 有 效 支 持 本 文 所 提出 的 肿瘤 类 疾病 过 度 与 错误 
诊治 的 检查 控制 机 制 的 核心 评判 环节 ， 为 降低 肿瘤 疾病 诊治 过 
程 中 的 过 度 与 错误 医疗 发 生 概率 起 到 良性 监督 作用 。 
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